INTRODUCCIÓN
El artículo 13 de la Norma para el Aseguramiento de la Calidad de la Información Estadística y Geográfica del Instituto Nacional de Estadística y Geografía (Norma) estipula que, para evaluar la calidad de la Información Estadística y Geográfica, las Unidades Administrativas, como mínimo, deberán calcular los indicadores de calidad y aplicar las metodologías de evaluación en los términos y periodicidad aprobados por el Comité. De acuerdo con el artículo 18 de la citada Norma, las Unidades Administrativas informarán al Comité los resultados de los indicadores y evaluaciones aplicados a los Procesos de Producción a su cargo, los cuales serán integrados en el Informe Anual de Resultados del Comité.
Considerando lo anterior y, para efectos de las atribuciones del Comité conforme al artículo 26 fracción IV de la Norma, se presenta la información del siguiente indicador de calidad.
1. MARCO DE REFERENCIA DEL INDICADOR
Según el tipo de proceso de producción y unidad administrativa, se determinará su uso externo o interno para ciertos niveles de desagregación.
• Office for National Statistics, UK. Guidelines for Measuring Statistical Output Quality. 2013. Página 28 y anexo A.
• United Nations Economic Commission for Europe (UNECE). Quality Indicators for the Generic Statistical Business Process Model (GSBPM) ‐ For Statistics derived from Surveys. 2016. Páginas 19, 21, 23, 24 y 48.
• Carl‐Erik Särndal et al. Model Assisted Survey Sampling, 2003. Capítulo 15.
• Carl‐Erik Särndal y Sixten Lundström. Estimation in surveys with nonresponse, 2005. En particular capítulos 5 y 9. .
Araceli Martínez Gama, directora de Marcos y Muestreo, Dirección General de Estadísticas Económicas.
Gonzalo Pérez de la Cruz, director en la Coordinación de asesores.
José de Jesús Jiménez Martínez, subdirector de Diseño Estadístico. Dirección General de Estadísticas Económicas.
Sofia Isabel Pérez Gutiérrez, jefa del departamento de Diseño Muestral de Encuestas Continuas. Dirección General de Estadísticas Económicas.
Mario Alberto Santillana Zapata, director general adjunto de Modelos de Información Gubernamental. Dirección General de Estadísticas de Gobierno, Seguridad Pública y Justicia.
Gerardo Barragán Romero, subdirector de Diseño Estadístico e Implementación de Encuestas Nacionales de Gobierno. Dirección General de Estadísticas de Gobierno, Seguridad Pública y Justicia.
Octavio Heredia Hernández, director general adjunto de Diseño y Marcos Estadísticos. Dirección General de Estadísticas Sociodemográficas.
Jaime Mojíca Cuevas, subdirector de Diseño Muestral de Vivienda. Dirección General de Estadísticas Sociodemográficas.
Noriki Armando Ibarra Medina, jefe del departamento de Selección y Control de Muestras Regulares, Dirección General de Estadísticas Sociodemográficas.
Fabián García Montaño, subdirector de Planeación, Análisis y Seguimiento. Dirección General de Geografía y Medio Ambiente.
Hortencia Medina Uribe, subdirectora de Estadísticas Ambientales en Actividades Económicas y Hogares. Dirección General de Geografía y Medio Ambiente.
Hugo Reginaldo Correa Bayardo, jefe del departamento de Análisis y Gestión del Subsistema. Vicepresidencia de Información Demográfica y Social.
2. ESPECIFICACIONES TÉCNICAS DEL INDICADOR
i) La unidad de observación sobre la cual se realizará el cálculo de la tasa de no respuesta.
ii) Las agrupaciones sobre las cuales se calculará el indicador (principales dominios de estudio, variables de estratificación o agrupaciones relacionadas con las variables principales del proceso de producción).
El total de las unidades de observación cambia dependiendo del tipo de proceso de producción, por ejemplo, para procesos de producción con muestreo probabilístico son las unidades contenidas en la muestra seleccionada excluyendo aquellas que no pertenecen a la población objetivo del proceso de producción, mientras que para un muestreo no probabilístico puede ser el conjunto de unidades en donde se intentó recabar la información a partir de algún esquema no probabilístico excluyendo también aquellas que no pertenecen a la población objetivo del proceso de producción. En el caso del aprovechamiento de registros administrativos con fines estadísticos es posible que exista un listado que conforma el total de unidades de observación de las cuales se requiere la información, sin embargo, hay casos en donde el registro administrativo conforma por sí mismo ese total de unidades de observación ya que la población objetivo es igual a la población del registro administrativo.
Se define como información admisible a aquella información que pasa los criterios de validación, incluyendo los casos en donde desde la fase de diseño se definen como admisibles códigos de no respuesta para alguna variable en particular. Con esta definición se puede asignar a cada una de las unidades de observación contenidas en U en alguno de los tres subconjuntos siguientes:
U1: El compuesto por aquellas unidades de observación en donde toda la información es admisible.
U2: El compuesto por aquellas unidades de observación en donde no se obtuvo información alguna, por ejemplo, por cuestiones como inseguridad, unidad no disponible (se negaron a recibir al entrevistador, el informante no está disponible cuando se hace la visita), etc.
U3: El compuesto por aquellas unidades de observación en donde se obtuvo información, pero al realizar la validación y codificación (en la fase de recolección o procesamiento del MPEG*) se decide que la unidad de observación tiene información no admisible en al menos una de las variables objeto del proceso de producción.
Para cada nivel de agregación g, g = 1,…,G, el número de unidades en U que pertenecen a g y al subconjunto Ui, i = 1,2,3; de donde el número de unidades de observación en U que pertenecen a g se obtiene como: Ng = Ng1 + Ng2 +Ng3.
La tasa de no respuesta antes de imputación a nivel unidad de observación para el nivel de agregación g, se define entonces como:
En el caso de muestreo probabilístico o de un muestreo no probabilístico basado en el tamaño de alguna variable de diseño, también se deberá calcular la versión ponderada de este indicador. En este caso se asume, sin pérdida de generalidad, que para cada agregación g las Ng unidades de observación en U que pertenecen a g tienen asociados los subíndices entre 1 y Ng, de manera que los primeros Ng1 corresponden a las unidades en U1, los siguientes Ng2 a las unidades en U2 y los últimos Ng3 a las unidades en U3. Entonces, la versión ponderada de este indicador para el nivel de agregación g, TNRwg se define como:
Donde:i) en el caso de muestras probabilísticas, wn corresponde al factor de expansión original de la unidad n que pertenece a g y,
ii) en el caso de muestras no probabilísticas, wn = Xn, con Xn el valor de la variable de diseño X, usada en el esquema determinístico para obtener la muestra, asociado a la unidadn que pertenece a g.
Para el caso de muestreo no probabilístico la información para calcular la versión ponderada del indicador proviene del marco considerado como referencia en el proceso de producción.
La tasa de no respuesta antes de imputación a nivel unidad de observación tiene como fin medir la no respuesta a nivel de unidad de observación, entendiendo ésta como aquella que se obtiene al considerar a las unidades de observación en donde no se obtuvo información alguna y a las unidades en donde la información de al menos una de las variables objeto del proceso de producción no tiene información admisible de acuerdo con la definición de la variable y los criterios de validación definidos en la fase de diseño para el proceso de producción en cuestión.
Se define como información admisible a aquella información que pasa los criterios de validación, incluyendo los casos en donde desde la fase de diseño se definen como admisibles códigos de no respuesta para alguna variable en particular. Es decir, esta no respuesta incluye:
i) Aquellas unidades de observación en donde se intentó recabar la información y no se obtuvo información alguna, por ejemplo, por cuestiones como inseguridad, unidad no disponible (se negaron a recibir al entrevistador, el informante no está disponible cuando se hace la visita), etc.
ii) Aquellas unidades de observación en donde se obtuvo información, pero al realizar la validación y codificación (en la fase de recolección o procesamiento del MPEG*) se decide que la unidad de observación tiene información no admisible en al menos una de las variables objeto del proceso de producción.
La tasa de no respuesta antes de imputación a nivel unidad de observación se define entonces como el cociente entre el total de las unidades de observación con las características definidas en los incisos i y ii y el total de las unidades de observación.
* De la fase de procesamiento sólo se considera la codificación y validación de la información de campo, todo procedimiento de imputación, edición y, en el caso de muestras probabilísticas, el ajuste de los factores de expansión no es parte de los procedimientos que se consideran para definir esta no respuesta. Por lo tanto, para el cálculo todos los insumos se deben tomar antes de aplicar cualquier algoritmo asociado a estas actividades.
El indicador se deberá publicar junto con los siguientes aspectos:
i) La unidad de observación sobre la cual se realizó el cálculo de la tasa de no respuesta.
ii) Las desagregaciones sobre las cuales se calculó el indicador (principales dominios de estudio, variables de estratificación o agrupaciones relacionadas con las variables principales del proceso de producción).
iii) Una nota de contexto en donde se haga énfasis de que no se observa una diferencia entre las tasas de no respuesta o bien indicando en donde se observa una discrepancia. Por ejemplo, "Considerando las tasas de no respuesta a nivel entidad federativa se observa que éstas varían entre 5% y 20% y resaltan las entidades X y Y con las tasas más altas de 18% y 20%, respectivamente".